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摘 要 : 模糊 测试 用 例 的 好 坏 是 影响 测试 效果 的 重要 因素 。 目 前 常规 的 生成 方法 是 随机 变异 和 人 工 协议 分 析 构 造 ， 分 
别 存在 变异 育 目 效率 低 和 构造 复杂 代价 高 的 问题 。 针 对 上 述 问 题 提 出 运用 深度 学 习 技 术 辅 助 测试 用 例 生 成 。 利 用 循环 
神经 网 络 处 理 字符 文本 序列 的 优势 ， 通 过 样本 数据 学 习 训 练 结构 特征 ， 并 预测 生成 符合 结构 特征 的 新 数据 ， 与 随机 变 
异 算 法 结合 构造 了 自动 生成 模型 。 通 过 以 LSTM 和 GRU 算法 模型 对 PDF 文件 输入 型 测试 用 例 生成 和 效果 评估 ， 生 成 
的 测试 用 例 总 体 优 于 常规 方法 有 较 好 的 通过 率 和 履 盖 率 。 该 方法 通过 循环 神经 网 络 的 辅助 实现 了 生成 快速 高 效 和 构造 
难度 低 的 优点 ， 达 到 了 生成 效果 和 花费 代价 的 平衡 。 
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Generation of fuzzing test case based on recurrent neural networks 
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Abstract: The quality of the fuzzing test case is an important factor to affect the effectiveness of fuzzing. At present, the 


conventional generation method is random variation and artificial protocol analysis, which have the problems of low blind 


efficiency and high complexity of construction. In view of the above problems, this paper proposed the use of deep learning 
technology to assist test case generation. Using the advantage of recurrent neural network to deal with character text sequences, 
it learned training structure features through sample data, and predicted new data that conforms to structural features, and 
constructed an automatic generation model combined with random mutation algorithm. By using LSTM and GRU algorithm 
model to generate and evaluate the input type test case of PDF files, the test cases generated ware better than conventional 
methods with better pass rate and coverage rate. With the help of recurrent neural network, the method achieved the 
advantages of fast and efficient construction and low difficulty of construction, and achieves the balance of generating effect 
and cost. 
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经 过 二 十 余年 的 发 展演 变 ， 模 糊 测试 技术 和 方法 不 断 改 进 和 提 

升 ， 自 动 化 水 平和 适用 场景 都 不 断 进步 和 拓展 。 人 们 针对 应 用 

根据 2017 年 11 月 美国 国家 标准 与 技术 局 (NIST) 发 布 的 。” 场景 和 流程 研发 出 诸如 PROTOS 、SPIKE 、FileFuzz 、 
NVD 个 数 为 1.34 万 个 ,是 2016 年 2 倍 多 ， 出 现 了 如 勒索 病毒 COMRaider、Sulley、Peach3 等 更 加 智能 、 自 动 化 的 工具 ， 极 
永恒 之 蓝 、CPU 蕊 片 级 的 Meltdown 和 Spectre 漏洞 等 重量 级 漏 。 大 地 提高 了 漏洞 发 掘 的 能 力 和 效率 。 但 受 限于 信息 系统 种 类 繁 
洞 ， 近 年 来 安全 漏洞 数量 和 和 危害 程度 不 断 上 升 态 势 。 漏 洞 的 测 。 多 和 协议 、 结 构 复 杂 多 样 等 因素 ， 其 中 测试 用 例 生成 技术 这 一 
试 和 发 掘 已 经 成 为 信息 安全 的 重要 课题 和 热点 。 随 着 软件 规模 。 重要 环节 仍 存在 一 些 不 足 : 一 是 随机 测试 用 例 构 造 速度 快 ， 但 
扩大 和 系统 复杂 度 提 升 ， 模 糊 测 试 在 漏洞 发 掘 方面 展现 出 较为 ”存在 变异 的 言 目 性 ， 导 臻 通过 率 和 代码 覆盖 率 低 ， 受 初始 样本 
优异 能 力 和 高 效 的 水 平 ， 是 漏洞 挖掘 中 一 种 重要 的 发 掘 方法 。 影响 大 ， 总 体 效率 较 低 ， 二 是 人 工 格式 或 协议 分 析 对 人 员 综 合 
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能 力 要 求 高 ， 脚 本 编写 繁琐 复杂 ， 复 杂 度 随 业 务 逻 辑 递增 ， 时 


间 和 精力 成 本 较 高 ， 难 以 复 用 和 规模 化 、 自 动 化 。 


得 益 于 深度 学 习 技 术 的 迅猛 发 展 和 优异 表现 ， 本 文 提出 基 
试用 


于 循环 神经 网 络 (recurrent neural networks， RNNs) 的 涡 
例 变异 生成 方法 ， 抓 住 测试 用 例 是 由 序列 化 数据 构成 的 特点 ， 
以 及 RNNs 自身 的 结构 特点 是 十 分 有 利于 


~ 


j 来 建 模 序列 型 数 


ChinaXiv 合 作 其 
徐 网 ,等 sy 成 


格式 非常 了 解 ， 在 深入 研究 


基础 上 ， 按 照 目标 软件 处 理 的 文件 格式 规约 或 协议 要 求 ， 产 生 
违反 部 分 规约 的 测试 数据 。 这 种 方法 产生 的 数据 有 较 高 的 合法 


标 软件 的 文件 格式 或 协议 规约 的 


率 及 代码 履 盖 率 ， 提 高 产生 数据 在 校 验 期 的 通过 率 ， 履 盖 可 能 


的 高 危 代 码 段 ， 发 现 潜在 的 安全 漏洞 ; 


出 


晶 需 要 花费 大 量 的 时 间 


和 精力 去 完成 文件 格式 或 协议 规约 的 理解 和 规则 编写 ,不同 的 


据 ， 将 之 结合 到 学 习 测试 用 例 的 序列 数据 ， 


建 模 识别 数据 特征 


和 结构 
率 优异 的 测试 用 例 。 


1 ”模糊 测试 及 测试 用 例 生成 简 述 


模糊 测试 原理 和 过 程 
模糊 测试 〈fuzzing) 是 一 种 通过 向 


1.1 


标 系统 提供 


非 预期 输 


预测 新 产生 数据 ,从 而 实现 自动 地 生成 通过 率 和 覆盖 


入 并 监视 异常 结果 来 发 现 软件 漏洞 的 方法 ， 


TS 


来 发 现 应 ) 
繁多 、 规 模 和 应 上 
样 ， 但 测试 总 体 的 阶段 结构 过 程 相似 ， 如 图 


1 所 示 。 


识别 目标 


识别 输入 


变异 生成 较 形 测 | 
试用 倒 


监视 目标 和 执行 
测试 用 蹇 


图 1 模糊 测试 过 程 


自动 化 地 使 用 大 量 


有 效 的 数据 作为 程序 的 输入 ,以 程序 是 否 出 现 异常 作为 标志 ， 
程序 中 可 能 存在 的 安全 漏洞 。 目 前 信息 系统 的 种 类 
环境 和 干 差 万 别 ， 因 此 测试 的 方法 也 是 多 种 多 


= 


从 图 1 中 能 够 比较 直观 地 理解 ， 在 模糊 测试 过 程 中 发 现 ; 


N 


洞 的 重要 阶段 是 构造 违反 目标 系统 正常 处 理 的 测试 用 例 ， 从 
触发 系统 的 异常 发 现 系 统 存 在 的 漏洞 。 因 此 ， 研 究 测试 ) 
生成 方法 是 提升 模糊 测试 效果 的 一 项 重要 的 内 容 。 
1.2 测试 用 例 生成 方法 简 述 和 特点 
模 测 斌 | 
和 基于 生成 的 数据 产生 方法 两 类 。 
a) 基 于 变异 的 数据 生成 方法 是 指 对 目标 软件 的 输入 部 分 
部 分 了 解 ， 从 一 个 正常 的 样本 
变 其 中 某 些 字段 ， 从 而 产生 新 的 畸形 测试 用 例 。 
要 去 理解 当前 样本 文件 的 结构 和 格式 ， 因 此 适用 


[ee 


例 的 


] 


] 例 产生 方法 本 质 上 分 为 基于 变异 的 数据 产生 方法 


发 ， 按 照 一 定 的 规则 和 策略 改 
这 种 方法 不 需 
围 比较 广 ; 


但 对 初始 样本 的 依赖 性 极 大 ， 不 同 的 初始 样本 会 带 来 不 同 的 代 


码 履 盖 率 、 测 试 深度 和 测试 效果 ， 所 以 效率 较 低 。 
b) 基 于 生成 的 数据 生成 方法 是 需要 对 


标 软件 的 预期 输入 


标 软件 差异 较 大 ， 难 以 复 用 、 适 用 范围 小 。 


测试 用 例 生成 方法 也 越 来 越 多 地 与 各 种 新 技术 和 新 方法 结 


= 


合 ， 如 遗传 算法 提升 测试 ) 
图 像 识别 、 语 言 处 理 等 方面 已 经 很 优异 的 效果 ， 
握 测试 用 例 生 成 原理 和 方法 后 ， 就 
技术 结合 起 来 。 


2 ”基于 循环 神经 网 络 的 生成 模型 


循环 神经 网 络 简 述 
循 
用 于 人 处理 序列 数据 的 
层 到 隐 含 层 再 到 输出 层 ， 
节点 是 无 连接 的 ， 


2.1 


> 


j 例 生成 效果 。 当 前 深度 学 习 技术 在 
同 理 在 理解 掌 
然而 然 地 将 之 与 深度 学 习 


不 神经 网 络 (recurrent neural networks，RNNs) 是 一 种 
经 网 络 。 传 统 的 神经 网 络 模型 是 从 输入 
层 与 层 之 间 是 全 连接 的 ， 每 层 之 间 的 
这 种 普通 的 神经 网 络 难以 处 理 前 后 文 关 联 类 


问题 。 例 如 ， 预 测 句 子 的 下 一 个 单词 是 什么 ， 则 需要 


到 前 男 


的 单词 ， 一 个 句子 中 前 后 单词 


解决 这 类 问题 。 已 经 在 众多 
processing, NLP) 中 取得 了 巨大 成 功 以 及 广泛 应 用 。 


Output Layer 


Hidden Layer 
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(b) 
图 2 循环 神经 网 络 结构 


人 循环 神经 网 络 最 鲜 


不 是 独立 的 。 相 比 一 般 的 神经 
网 络 来 说 ， 该 神经 网 络 能 够 处 理 序列 变化 的 数据 ， 就 能 很 好 地 
自然 语言 处 理 (natural language 


明 的 特点 是 隐藏 层 之 间 存 在 权重 连接 ， 


现 有 的 输入 与 之 前 和 后 续 存 有 关系 .图 2(a) 是 一 个 典型 的 RNNs 
的 连接 情况 示意 图 ， 体 现 了 同一 层 之 间 的 节点 连接 。RNNs 包 


含 输入 单元 (Input units)， 


输入 集 标记 为 {x0,x1,.…,xt,xt+1,.…}， 输 


出 单元 (Output units) 的 输出 集 则 被 标记 为 {y0,y1,.…,yt,yt+1.,..}。 


RNNs 还 包含 隐藏 单元 (Hidden units)， 将 其 


输出 集 标记 为 


{s0,s1,,stst+1,…}， 这 些 隐 藏 单元 完成 了 最 为 主要 的 工作 。 图 


2(b) 所 示 是 将 循环 神经 网 络 进 行 展 开 成 一 个 全 神经 网 络 ， 更 
于 人 们 理解 。 
模糊 测试 对 象 的 输入 数据 是 由 各 种 的 序列 数据 组 成 ， 数 : 


之 间 存 在 上 下 文 关系 ， 如 结构 性 的 文档 、 各 种 格式 文档 数据 ] 
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列 和 解析 ， 系 统 处 天 
择 运 用 循环 


2.2 生成 模型 原理 和 描述 


效果 较 优 ， 但 时 间 和 资源 耗费 代 
类 ， 但 效果 欠 佳 。 为 此 本 文 寻找 折 中 的 办 法 ， 提 出 了 基于 
原理 是 结合 深度 学 习 的 优势 构 
9 ， 让 机 器 对 有 效 的 文本 型 数据 进行 学 习 
成 合适 较 优 的 处 理 模 


度 1 
RNNs 的 生成 模型 。 
特征 提取 算法 和 模型 


建 


训练 ， 
从 而 实 
异 的 规则 和 策略 组 合 形 成 测试 
据 和 模 站 
系统 的 基本 规约 ， 一 方 


Ey 


型 


较 易于 构建 和 训练 网 络 ; 


通过 前 文 简 述 的 测试 ) 


经 网 络 来 解决 处 到 


时 按照 预定 的 流程 进行 解析 处 理 ， 
这 类 问题 的 出 发 点 。 


] 例 生成 方法 对 


比 ， 基 于 生成 的 方法 


介 高 ， 基 于 变异 的 方法 生成 速 


2 


自动 调 


岗 


整 优化 网 络 参数 玫 


其 基本 方法 


型 参数 ， 


自动 生成 符合 数据 结构 和 规约 的 新 数据 ， 最 后 加 入 变 


测试 的 初衷 比较 


本 文选 


j 例 集合 。 
合 ， 一 方面 较 大 限度 地 遵循 被 
用 要 产生 违反 规约 的 数据 触发 异常 。 

字符 文本 型 输入 数据 为 研究 对 象 ， 一 是 考虑 到 模 


通过 该 方式 产生 的 数 
目标 


实现 的 复杂 程度 ， 目 前 计算 机 中 常用 的 可 见 字符 数 为 98 个 ， 


二 是 字符 型 数据 做 映射 量 少 ， 相 对 需 


2.2.1 输入 处 


该 


层 将 训练 数据 进行 数据 


理 层 


ChinaXiy 


加 
sy 成 


适合 网 络 模 型 处 
间 ， 为 训练 提供 
引 生 成 映射 向 量 表 。 
经 网 络 计算 的 向 量 数据 ， 
生成 唯一 字符 集 ， 
一 的 映射 到 数据 向 量 ， 生 


于 4 


月 沁 


AN 


时 要求 的 数据 类 型 和 结构 ， 
数据 输入 源 。 其 主要 完成 如 下 步骤: 
为 了 把 字符 型 的 数据 集 


E、 转 换 等 预 处 理 后 转换 


EB 成 
创建 RNNs 输入 空 


集中 的 字符 


再 选用 


月 泌 


合适 的 算法 


先 遍历 训练 数 
字符 集中 的 每 个 字符 一 


成 字符 和 数字 向 量 相互 转换 映射 表 


( 即 字符 映射 向 量 表 和 向 量 映 射 字符 表 ), 从 而 能 够 让 字符 和 向 


EE， 对 复杂 的 数据 自 


量 相 互 转换 。 常 见 的 生成 方法 有 one-hot 编码 、 排 序 生成 等 。 
借鉴 Word2Vec 的 原理 


居 合 需 建 模 增 加 向 量 映 


射 方法 来 进行 关 


射 处 


洲 

是 泣 
< 二 

ml 

Qn 

mr 7 


一 


把 字符 型 和 


区 计算 ， 实 现 非 字符 型 或 字符 组 合 型 数据 的 映 
里 ， 适 应 更 多 种 类 的 训练 数据 。 
训练 数据 集 向 量化 。 完 成 映射 向 量 表 产生 后 对 输入 的 训 
进行 向 量化 映射 转换 ， 


要 的 计算 和 存储 资源 较 少 ， 在 常规 运算 能 力 下 ， 相 对 计算 资源 


和 训练 时 间 要 求 适中 ; 


三 是 目前 网 络 应 用 发 


展 较 快 xml、json、 


向 量 型 集 


口 ， 


是 对 训练 数据 的 向 


量化 过 程 。 


合 编码 转换 为 数字 


c) 小 批 次 (mini-batch) 分 割 处 理 。 


因 


算 处 理 能 力 差距 ， 不 能 采用 采用 


| 练 的 数据 集 规模 和 计 
全 数据 集 (full batch learning) 的 
1! 经 网 络 构造 参数 选择 合适 的 


batch-size 和 squence_length 对 数据 集合 进行 分 批 次 训练 。 定 义 


| batch_size)， 定 义 单个 序列 长 


CE 是 NXM 的 数组 。 


尼 输 入 空间 。 按 mini-batch 分 割 后 每 个 batch 的 大 


小 ， 建 立 Shape=NXM 的 input 张 量 和 targets 张 量 ， 和 定义 


字符 文本 型 在 实际 应 用 也 较 广 ,在 实际 应 用 具备 较 高 的 性 价 比 形式 训练 。 考 虑 计算 资源 和 让 
四 是 虽然 模型 的 输入 是 以 字符 .单词 或 易 向 量化 的 数据 为 对 象 ， 
而 随 着 深度 学 习 的 算法 模型 不 断 更 新 和 降 维 方法 的 进步 ， 分 块 。 ”一 个 batch 中 的 序列 个 数 为 N(R 
处 理 或 新 的 数据 向 量化 方法 ， 处 理 更 多 种 类 的 数据 扩展 应 用 对 度 为 M( 即 为 squence_length)， 每 个 batch 前 
象 。 d) 创 建 数 
为 此 文本 针对 字符 文本 型 数据 构建 基于 循环 神经 网 络 的 生 
成 模型 ， 实 现 学 习 、 训 练 和 预测 生成 新 数据 ， 最 终结 合 变异 策 。 keep_prob 空间 用 于 控制 dropout 的 保留 节点 数 。 
略 组 合 产生 新 的 测试 用 例 。 这 里 简要 介绍 生成 模型 的 结构 和 功 ”2.2.2 循环 神经 网 络 层 


能 模块 。 按 医 


区 


3 所 示 分 三 层 进行 介绍 。 


cp 


Batch-size*seq_length 


PT 


图 3 生成 模型 组 成 结构 


该 层 是 


测 产 生 新 数据 。 
训练 和 网 络 预测 两 个 阶段 。 
络 和 设 定 训练 参数 等 构建 循 ] 
网 络 迭 代 训 练 优 


屁 .入 


作为 上 下 两 


成 模型 的 核心 ， 对 下 接 | 
刁 的 衔接 ， 数 据 运 算 处 理 分 为 


首先 网 络 训 练 阶 段 ， 按 照 选 


不 


预测 阶段 ， 


上 
| 


评 人 


经 网 络 ， 将 输入 层 的 数据 输 
化 产生 网 络 参 数 ， 
加 载 初始 数据 和 训练 好 的 网 络 参数 ， 通 过 循 


网 络 预测 产生 新 的 概率 矩阵 输出 至 生成 变异 层 。 


输入 层 的 数据 ， 对 上 预 


网 络 
取 的 网 
入 
络 
神经 


1 练 效果 ; 然 


网 


后 
不 


上 时/ 
累 


构建 。 


RNNs 提出 后 ， 石 


RNNS， 


网 络 模型 的 基本 1 


青 况 和 特点 。 


慨 的 效果 的 最 重要 的 部 分 是 神经 网 络 模型 的 选择 和 
究 者 们 不 断 优化 提出 了 多 种 复杂 的 
这 里 着 重 介 绍 下 使 用 最 广泛 、 最 成 功 的 LSTM 和 GRU 


(b) 


bh 
L our 


图 4 LSTM 和 GRU 模型 结构 
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a)LSTM (long short-term memory) 是 一 种 特殊 的 RNNs， 
1997 年 Hochreiter 和 Schmidhuber 最 早 提出 ， 主 要 是 为 了 解 


决 长 序列 训练 过 程 中 的 梯度 消失 和 梯度 爆炸 问题 。 


简单 来 说 ， 


就 是 相 比 普通 的 RNN, LSTM 能 够 在 更 长 的 序列 中 有 更 好 的 表 


只 有 一 种 记忆 又 加 方式 ， 对 很 多 需要 “长 


岗 。 如 图 4(a) 所 示 ， 通 过 门 控 状 态 来 控制 传输 状态 ， 记 住 需要 
长 时 间 记 忆 的 ， 忘 记 不 重要 的 信息 ， 而 不 像 普通 的 RNN 那样 
期 记忆 ”的 任务 来 说 


尤其 好 用 。 但 也 因为 引入 ] 
训练 难度 加 大 了 很 多 。 


很 多 内 容 ， 导 致 参数 变 多 ， 也 使 得 


b)GRU (gate Recurrent Unit) 与 LSTM 网 络 一 样 也 是 为 了 


解决 长 期 记忆 和 反 向 传播 中 的 梯度 等 问题 。 


GRU 输入 输出 的 结 


构 与 普通 的 RNN 相似 ， 其 中 的 内 部 思想 与 LSTM 相似 。 与 


LSTM 相 比 ， GRU 内 部 少 了 一 个 ¢ 门 控 ”， 


结构 参见 图 


4(b) 所 


示 , 参数 比 LSTM 少 , 但 是 却 也 能 够 达到 与 LSTM 相当 的 功能 。 


2.2.3 生成 变异 层 


二 We 
该 层 首 先是 


试用 例 组 装 方 法 输出 测试 用 例 集 。 


a) 数 据 生成 的 过 程 。 在 神经 网 络 加 载 网 络 参 数 和 初始 数据 
后 ， 网 络 能 按 学 习 好 的 参数 、 权 重 等 不 断 循环 预测 新 序列 向 量 
的 概率 矩阵 ， 依 照 合适 的 策略 ， 再 把 序列 向 量 的 概率 矩阵 映射 
为 新 的 目标 数据 ， 通 过 这 一 过 程 实现 了 新 数据 的 生成 。 这 里 调 
整 softmax 取样 的 温度 (temperature) 和 引入 随机 数 选择 是 影响 生 
办 法 。 取 样 的 温度 变化 会 影响 RNNs 生成 置信 
信 度 ， 生 成 数据 就 更 保守 ; 


成 新 数据 的 常 ) 
度 ， 例 如 降低 温度 就 会 有 更 高 的 


RNNs 预测 的 新 序列 矩阵 生成 新 数据 ， 然 后 
根据 变异 策略 和 算法 对 产生 的 数据 进行 必要 的 变异 ， 最 后 按 测 


相反 ， 温 度 高 ， 相 关 性 越 低 数据 就 更 多 元 化 、 更 高 的 畸形 度 和 
更 多 可 能 触发 异常 。 同 理 引 入 随机 数 选择 预测 概率 最 大 的 序列 


为 新 输出 ， 也 会 增加 生成 数 


RNNS 


b) 数 据 的 变异 过 程 。 前 面 
相似 的 结构 性 


机 变异 或 其 


居 的 多 样 性 。 通 过 这 些 优 化 和 调整 
方法 ， 最 终 让 网 络 生成 的 更 多 样 和 通过 率 较 高 的 测试 数据 。 
预测 产生 的 数据 除了 具备 
也 产生 了 一 定 的 变异 性 ， 但 受 映射 矩 阵 集合 的 限 
制 ， 原 则 上 难以 产生 超出 映射 集合 的 变异 数据 ， 因 此 引入 如 
也 针对 性 变异 算法 ， 可 以 增加 变异 度 扩展 测试 


随 
j 例 


的 变异 集合 空间 ， 从 而 让 生成 的 测试 
盖 更 广 的 执行 路 径 。 


j 例 触发 更 多 的 异常 和 履 


9 组 装 生 成 过 程 。 考 虑 到 可 行 性 、 计 算 资源 和 时 间 成 本 等 


因素 ， 运 用 


RNNs 学 习 训练 和 产生 的 数据 大 多 是 不 可 以 直接 被 


加 载 执行 的 数据 片段 或 未 分 割 的 数据 块 ， 需 按 测 试 对 象 对 数据 


的 处 理 规则 和 策略 将 新 数据 分 嘎 
例 ， 最 终 输出 形成 测试 用 例 集合 。 


3 ”实验 和 结果 分 析 


到 
一 


和 组 装 产 生 可 以 执行 的 测试 


数据 统计 情况 ， 评 估 RNNs 训练 差异 和 性 能 情况 。 选 择 构 建 对 


比 测试 


的 效果 。 


] 例 集 ， 评 估 生 成 的 新 / 
较 高 的 履 盖 率 和 通过 率 ， 以 通过 率 和 覆盖 率 来 验证 该 方法 模型 


首先 简 述 CAJViewer7.2 和 PDF 文件 
次 结合 PDF 文件 格式 和 模型 特点 提出 实验 方案 ; 


] 例 在 模糊 测试 过 程 中 能 否 具备 


格式 的 基本 情况 ， 其 
然后 简 述 方案 


实施 完成 情况 ， 最 后 以 通过 率 和 有 履 盖 率 这 两 项 重要 指标 来 分 析 


A 
了 实验 结果 。 


3.1 


实验 对 象 简 述 和 设计 分 析 


3.1.1 实验 对 象 简 述 


alCAJViewer 
中 国 期 刊 网 的 TE 


是 中 国 期 刊 网 的 专用 全 文 格式 阅读 器 ， 支 持 
B、CAJ、NH、KDH 和 PDF 格式 文件 阅读 ， 


有 支持 MAC、iPad、iPhone、Android 平台 的 版 本 ， 使 用 较为 


广泛 。 这 里 选 


windows 版 的 CAJViewer7.2 


版 完成 以 下 实验 。 


b)PDF (portable document format， 便 携 式 文档 格式 ) 是 由 


Adobe Systems 用 


于 与 应 用 程序 、 操 作 系统 、 硬 件 无 关 的 方式 进 


行文 件 交 换 所 发 展 出 的 文件 格式 。PDF 文件 格式 是 实验 的 重要 


对 象 。 这 里 简 述 PDF 文件 的 基本 结构 。 如 图 
文件 大 致 可 以 分 4 个 部 分 ， 即 首部 、 文 件 体 、 


5(a) 所 示 的 PDF 
交叉 引用 表 和 尾 


xref 
08 | 
首部 30obj 0000000000 65535f trailer 
<< 0000000010 00000n “< 
文件 体 /Type /Pages 0000000082 00000n /Size 8 
/Count 1 000000013400000n /Root10R 
交叉 引用 表 /Kids [40R] “0000000198 00000n >> 
2 0000000348 00000n startxref 
尾部 endobj 0000000450 00000n 569 
0000000481 00000n %%EOF 
(a) (b) (o (d) 


图 5 PDF 文件 结构 


PDF 文件 结构 的 四 个 部 分 解释 : 


(a) 首 部 ， 文 件 的 开头 ，%PDF-1.7 的 


多 式 ， 其 中 最 后 一 位 


就 是 PDF 文件 格式 版 本 号 ， 表 示 PDF 文件 遵循 的 版 本 规范 ， 


如 “1.7”， 


目前 最 新 的 版 本 为 1.7。 


(b) 文 件 体 ， 由 若干 个 obj 对 象 来 组 成 ， 如 图 5(b) 所 示 ， 第 


个 数字 是 对 象 号 ， 唯 一 标志 
来 表明 它 在 被 创建 后 的 第 几 次 修改 ， 新 创建 的 产生 号 是 


关键 字 obj 开始 ， 


个 对 象 ， 第 二 个 是 产生 号 ， 
0。 1 
对 象 的 内 容 应 该 是 包含 在 << 和 >> 之 间 的 ， 最 


后 以 关键 字 endobj 结束 。 包 含 二 进 制 数据 的 obj 内 还 会 嵌 套 关 


为 了 验证 循环 神经 网 络 生成 模型 在 测试 用 例 生成 效果 ， 本 


文选 择 了 CAJViewer7.2 阅读 器 和 PDF 文人 


估 。 让 生成 模型 学 习 训练 PDF 文件 中 的 字符 文本 数据 ,再 


型 


YE 


生成 不 同 于 已 学 习 的 数据 ， 验 证 


为 对 象 进行 实验 评 


键 字 stream 和 endstream 来 存放 二 进 制 数据 。 


(@) 交 叉 引 用 表 ， 如 图 5(c) 所 示 ， 用 来 索引 各 个 obj 对 象 在 
文档 中 的 位 置 ， 以 实现 随机 访问 。Xref 标志 一 个 交叉 引用 表 的 


台 ， 有 8 个 对 象 。 


开始 ， 表 的 第 一 行 08 说 明 下 奋 


ij 各行 所 描述 的 对 象 号 是 从 0 开 
0000000000 65535 f， 一 般 每 个 PDF 文件 都 


模 


模型 能 否 产生 新 数据 ， 形 成 


是 以 这 一 行 开 


台 交 叉 应 用 


表 的 ， 对 象 0 的 起 始 地 址 为 


0000000000， 产 和 9 


E 写 (generation number) 为 65535， 也 是 最 大 


产生 号 , 不 可 以 


4 进行 更 改 ,， 最 后 的 f 表 明 该 对 象 为 free, 这 


吧 
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可 以 理解 为 是 文件 头 。0000000009 00000 nm 就 是 表示 对 象 1， 


0000000009 是 其 偏 移 地 址 ，00000 为 5 位 产生 号 ， 


0 表明 该 对 


象 未 被 修改 过 , n 表示 该 对 象 在 使 用 ,区别 与 自由 对 象 (站 ， 可 以 


更 改 。 


(d) 尾 部， 虽然 放 在 文件 的 尾部 ， 但 这 是 文件 
头 。 如 图 5(d) 所 示 , /Size 8 说 明 该 PDF 文件 的 对 象 数 目 ; 
Startxref 553 说 明 交 叉 引 用 表 


1 0 R 说 明 根 对 象 的 对 象 号 为 1; 


内 容 逻 辑 的 开 
/Root 


的 偏 移 地 址 ， 从 而 可 以 找到 PDF 文档 中 所 有 的 对 象 的 相对 地 
址 ， 进 而 访问 对 象 。%%EOF 为 文件 结束 标志 。 


3.1.2 分 析 和 实现 思路 
a) 理 解 文档 的 重点 要 素 和 关系 。 
址 ， 可 以 理解 为 对 象 的 “目录 ”。 


xref 是 标定 各 个 对 象 的 地 


ChinaXiy 例 作 期 刊 ， 


徐 鹏 ， ,£4 网 VY 测试 用 例 
验 。 
3.2.1 PDF 样本 搜集 和 预 处 理 

a) 息 取 PDF 样本 文件 。 互 联网 上 发 布 有 大 量 的 各 种 类 型 的 
PDF 文件 , 是 一 个 较 好 的 PDF 样本 获取 源 。 为 采集 种 类 多 样 的 
PDF 文件 样本 ， 以 百度 搜索 引擎 为 入 口 ， 用 “主题 关键 字 
+filetype:pdf” 的 组 合 的 思路 进行 搜索 pdf 文件 类 型 的 链接 。 为 
绕 过 百度 搜索 引擎 的 反 怜 虫 机 制 ， 这 里 使 用 
技术 ， 编 写 了 基于 浏览 器 的 怜 虫 。 综 合 互 联网 关键 字 排 行 和 类 
别 选取 了 300 个 主题 关键 字 , 运行 1 天 时 间 扑 取 PDF 文 件 12 006 


A 


b)PDF 样本 集合 整理 。 下 载 的 PDF 文件 涉及 的 类 型 、 种 类 


python+selenium2 


trailer 是 文档 实际 解析 的 文件 


头 ， 通 过 重要 的 Root 指向 Catalog 对 象 后 ， 就 相当 于 把 接力 棒 


交 给 了 文档 的 obj 对 象 。 整 个 文档 的 内 容 
标志 的 树 状 结构 。 以 图 6 所 示 为 例 ， 


结构 是 ! 
首先 trailer 标定 root 指向 


以 ID 为 指向 


了 Catalog 的 ID, 再 Catalog 分 支 指向 Pages 和 Outline, 再 Pages、 
Page、Resources 等 ， 最 终 按 ID 指向 序 的 链条 延伸 下 去 。 可 以 


向 不 断 发 现 和 解析 处 理 


理解 CAJViewer 阅读 器 处 理 的 核心 逻辑 就 是 根据 obj 对 象 的 指 


较 多 并 存在 相似 的 文件 类 型 ,对 获取 的 样本 集合 进行 版 本 识别 、 
分 类 和 样本 去 重工 作 ， 获 得 有 效 的 PDF 文件 11 096 个 ， 涵 善 
版 本 从 1.0 一 1.7 并 按 此 进行 分 类 ， 文 件 大 小 从 8 KB 一 43 
MB 。 以 CAJViewer 为 目标 系统 编写 执行 验证 脚本 和 用 
PeachMinset 进行 最 小 化 数据 集 精 简 筛 选 获得 1 149 个 PDF 文 
牛 的 精简 样本 集 。 

ee 出 于 简化 实验 和 适应 模型 数据 集 的 


的 循环 。 因 此 对 obj 对 象 分 析 理 解 是 思 


考 的 重点 。 
trailer 
Catalog 
pages ‘Outline 
root root 
Page 1 | | Pagen | Outine | ===== Outline 
Resources | contents 
/ ee 
font td stream 
图 6 PDF 文件 obj 对 象 组 织 结构 
b) 分 析 obj 对 象 情况 。 上 述 分 析 所 知 ，PDF 文档 结构 的 主 


体 是 


obj 对 象 数据 组 成 -Adobe 公司 2006 年 1 


1 月 发 布 的 pdfl.7 


版 格式 文档 中 这 部 分 的 说 明 描 述 有 大 约 1 200 页 ， 如 果 人 工分 


析 编 写 模糊 测试 模板 变异 生成 文档 存在 
对 象 种 类 和 约 规 较 多 必定 工作 量 巨大 ; 
计算 机 知识 水 平 有 较 高 的 要 求 。 
了 stream 部 分 是 有 二 进 制 
E 成 模型 。 

0O) 实 践 思考 和 设计 。 
外 部 扩展 库 实现 处 理 ， 但 


| 


以 下 难度 ， 一 是 医 
二 是 对 模版 编写 人 员 的 
通过 对 obj 对 象 的 分 析 可 知 除 
编码 其 余 是 可 见 字符 编码 , 较 适用 于 


stream 部 分 的 数据 较为 复杂 ， 大 多 由 
受 限 于 计算 能 力 和 时 间 成 本 等 因素 ， 


ob] 


因此 把 PDF 文档 分 解 为 obj 对 象 块 来 作为 处 理 
集 PDF 样本 集 、 处 理 提 取 obj 对 象 数据 、RNNs 网 络 训练 obj 


对 象 ， 设 计 了 搜 


对 象 、RNNSs 预测 生成 新 obj 对 象 、 变 异 新 obj 对 象 、 组 装 obj 


对 象 生成 测试 用 例 集 和 实验 评估 的 实验 步骤 。 
3.2 实验 过 程 


依照 上 i 
及 分 析 、 生 成 测试 用 僧 


流 


述 思 路 ， 本 文 按 PDF 样本 搜集 和 预 处 理 、 模 型 训练 
集 和 执行 测试 结果 评估 4 个 部 分 进行 实 


目的 ， 过 滤 了 对 包含 “stream” 二 进 制 的 数据 ， 提 取 精 简 样 本 
集中 PDF i 的 obj 对 象 ， 如 图 5(b) 所 示 以 “obj” 开 
头 到 “endobj” 结 束 。PDF 样本 存在 多 种 编码 和 字符 集 的 问题 ， 
一 一 识别 并 处 理 花费 时 间 较 长 ， 这 里 只 提取 了 可 显示 的 ASCII 
字符 ， 然 后 计算 其 长 度 、md5 并 去 重 后 存 入 数据 库 ， 共 计 提 取 
316 991 条 obj 对 象 数据 ， 长 度 从 11 字 节 一 435 ”016 字 节 ， 
长 度 区 间 分 布 如 图 7(a) 所 示 。 经 过 分 析 数 据 后 以 长 度 分 布 为 调 
准 抽样 选取 78 406 条 数据 ， 训 练 数据 长 度 分 布 情况 如 图 7(b) 
所 示 ， 最 终 形成 14.6 ”MB 大 小 的 训练 数据 和 
总 数据 集 obj 对 象 的 长 度 区 间 数 量 
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(a) 
训练 集 obj 对 象 长 度 区 间 数 量 表 
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图 7 训练 集 obj 对 象 长 度 分 布 情况 
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3.2.2 模型 训练 和 分 析 

a) 深 度 学 习 平 台 选 择 。TensorFlow 是 谷歌 2015 年 开源 的 基 
于 DistBelief 研发 的 第 二 代 人 工 智 能 学 习 系统 ， 将 复杂 的 数据 
结构 传输 至 人 工 智能 神经 网 中 进行 分 析 和 处 理 过 程 的 系统 。 与 
Caffe、Theano、Torch、MXNet 等 框架 相 比 , TensorFlow 在 Github 
上 Fork 数 和 Star 数 都 是 最 多 的 ， 而 且 在 图 形 分 类 、 音 频 处 理 、 
推荐 系统 和 自然 语言 处 理 等 场景 下 都 有 丰富 的 应 用 。 综 合 以 上 
原因 ， 实 验 选 用 Tensorflow 1.3 版 构建 神经 网 络 层 。 

b) 训 练 参 数 和 硬件 配置 。 为 了 对 比 训练 效果 选取 了 LSTM 
和 GRU 两 种 主要 模型 按 batch-size 为 20 和 50 组 合 形成 4 组 参 
数 ， 其 他 参数 统一 设置 为 序列 长 度 10、2 层 、128 隐 层 节点 、 
0.002 学 习 率 和 100 轮 次 训练 。 硬 件 配置 : Intel Xeon® CPU 
E5-26xx v2，2 GB 内 存 的 服务 器 2 台 。 每 一 种 模型 100 轮 的 训 
练 时 间 大 约 为 30 hp， 训 练 的 字符 映射 表 字 符 数 量 为 98， 生 成 
LSTM 模型 参数 大 小 为 3 125 436 字 节 ，GRU 模型 参数 大 小 为 
2 382 012 字 节 。 训 练 参数 和 结果 情况 如 表 1 所 示 。 这 里 分 别 依 
照 顺序 记 为 LSTM-20、LSTM-50、GRU-20 和 GRU-50。 
表 1 模型 训练 对 比 


模型 分 割 最 佳 验证 ppl 时 /分 / 轮 
LSTM 20 model-5114362 4.26923 18.8478 
LSTM 50 model-2681565 3.791913 18.02646 

GRU 20 model-6773074 5.322278 17.8175 

GRU 50 model-884640 4.298033 16.26637 

验证 Perplexity 对 比 图 
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图 8 训练 Perplexity 对 比 
3.2.3 生成 测试 用 例 集 
生成 测试 用 例 由 obj 对 象 生成 、 数 据 变异 和 数据 组 装 这 三 
个 步骤 。 

a)obj 对 象 生成 。 为 了 对 比分 析 分 别 将 训练 所 得 的 最 佳 的 4 
个 模型 参数 加 载 到 RNNs 网 络 , 让 每 个 网 络 分 别 生 成 10 000 个 
obj 对 象 ， 共 计 40 000 个 ， 长 度 从 17 一 38 630 字 节 。 如 图 9 所 
示 ， 可 以 看 出 网 络 生 成 的 数据 效果 很 好 ， 己 经 能 产生 和 训练 集 
合 中 的 单词 和 结构 很 相似 的 obj 对 象 。 通 过 把 生成 obj 对 象 导 
入 到 数据 库 和 总 obj 对 象 数据 集 做 md5 比 对 , 未 发 现 md5 一 致 
的 两 条 数据 ， 说 明 网 络 是 能 够 自行 生成 新 的 不 同 的 数据 。 
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/BaseFont /DY1255+ZIKB4C-1255 


556 500 611 500 0 ] 
g 6799 OR 
criptor 9704 0 R 


b) 变 异 obj 对 象 。 
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图 9 循环 神经 网 络 生成 的 新 obj 对 象 


综合 obj 对 象 的 结构 特点 ， 为 了 


径 网 络 的 模糊 测试 用 例 生成 


备 较 好 的 通过 率 ， 这 里 


只 对 “obj” 与 “endobj” 之 间 数 据 进 


了 字符 集 变异 和 二 进 制 变异 。 图 10 所 示 为 月 
据 阀门 值 控制 的 随机 变异 算法 。 由 mut_frac 和 p 参数 分 别 


行 变 异 ， 变 异 过 程 中 用 到 
有 python 编写 的 根 
周 整 


变异 数量 和 两 种 变异 方式 的 概率 。 图 11 所 示 为 以 mut_frac=0.05 


和 p=6 为 参数 进行 变异 的 效果 样 例 。 


def strRandomMutator(chars, str='Mutator', mut_frac=0.05, p=6): 


bytes_arr=bytearray(str, 'ascii') 
data_len = len(bytes_arr) 

# 按 设 定 的 变异 率 计算 要 变异 的 字符 数量 
change_num = int(data_Lenxmut_frac) 


if data_len>change_num and data_len>18 and change_num>0: 


# 随机 选择 要 变异 的 字符 位 置 
change_pos=random.sample(range( 
for pos in change_pos: 


# 加 入 随机 因子 来 决定 是 字符 集合 或 二 


if_rand = random.randint(0, 
if if_rand>p:# 二 进 制 随机 变异 


5,data_len-9),change_num) 


进 制 变异 


10) 


bytes_arr[pos] = random.randint(0,255) 


else: # 字符 集 变异 
bytes_arr[pos] = ord(ra 
ret_byte=bytes(bytes_arr) 
return ret_byte 


ndom.sample(chars, 1)[0]) 


10 ”随机 变异 算法 
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图 11 变异 后 的 新 obj 对 象 


0c) 数 据 组 装 。 由 网 络 生 成 的 数据 是 obj 对 象 不 能 直接 被 
验证 ， 就 需要 把 obj 对 象 
组 合成 为 CAJViewer 可 以 解析 的 PDF 文件 。 这 里 按照 PDF 文 


CAJViewer 打开 执行 ， 为 了 进行 评估 


件 基 本 结构 分 析 创建 了 7 个 对 象 节点 的 PDF 文件 


为 用 例 生 成 模 


板 ,将 变异 后 的 obj 对象 蔡 换 更 新 PDE 模板 的 Catalog、Outlines、 
Pages、Page 和 Contents 部 分 ， 以 用 于 测试 评估 obj 对 象 在 不 同 


节点 的 效果 。 为 了 进行 实验 评估 对 比 ， 


生 5 000 个 测试 用 例 ， 记 为 PEACH 


例 ， 记 为 NORMAL 数据 集 ; c)RNNs 
抽取 1 000 个 obj 对 象 按 随机 变异 产 委 


装 生成 5 000 个 测试 用 例 ， 记 为 RNNS 数据 身 


创建 了 三 种 测试 数据 


生成 的 obj 对 象 数 据 集中 


漆 


ga) 以 用 例 生成 模板 PDF 文件 为 样本 用 Peach3 的 随机 变异 方式 产 
数据 集 ; b) 从 之 前 提取 的 
obj 总 数据 集中 随机 抽取 1 000 个 数据 组 装 生成 5 000 个 测试 用 


| 


新 的 1 000 个 obj 对 象 引 
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d) 执 行 测试 用 例 集 。 为 评估 测试 用 例 集 的 效果 和 对 比 ， 在 。 ”之 为 不 通过 。 通 过 率 和 禾 盖 量 对 比如 表 2 所 示 。 
Python 2.7 环境 下 编写 了 CS 结构 的 测试 用 例 执行 工具 , 中 心服 表 2 通过 率 和 覆盖 量 对 比 
务 端 存放 测试 用 例 集 和 负责 分 发 测试 用 例 ， 执 行 客户 端 安装 测试 用 例 集 标记 覆盖 量 。 总 覆盖 量 。 通过 率 
CAJViewer 执行 环境 ， 与 服务 端 通信 获取 测试 用 例 ， 分 别 执行 PEACH peach-5000 151166 151166 52.80% 
用 Peachminset 产生 trace 文件 和 pydbg 执行 监控 用 于 结果 评估 Catalog-1000 192487 38.50% 
和 分 析 。 由 3 台 服 务 器 分 别 虚拟 1 台中 心服 务 端 和 10 台 客 户 端 Outlines-1000 203151 56.50% 
完成 执行 测试 。 RNNS Pages-1000 192673 236411 43.20% 
3.2.4 结果 分 析 Page-1000 220387 65.10% 
为 验证 和 评估 生成 模型 的 可 行 性 和 生成 的 测试 用 例 效果 情 Contents-1000 © 202106 68.50% 
况 ， 本 文 针对 选用 的 神经 网 络 和 测试 用 例 来 完成 结果 分 析 ， 进 Catalog-1000 181724 96.20% 
行 了 一 是 生成 模型 性 能 和 可 行 性 分 析 ; 二 是 对 比 评估 分 析 测 试 Outlines-1000 193530 97.40% 
用 例 效果 。 NORMAL Pages-1000 182910 208621 97.60% 
1) 生 成 模型 性 能 和 可 行 性 分 析 Page-1000 207394 97.20% 
本 次 实验 中 选用 了 LSTM 和 GRU 网 络 模 型 实验 测试 ， 选 Contents-1000 = 193543 98.10% 
取 其 中 最 优 的 参数 来 生成 的 数据 生成 形式 如 图 9 所 示 的 数据 。 由 表 2 结果 对 比 可 知 ，PEACH 数据 集 是 随机 变异 的 产生 ， 


从 图 中 能 直观 地 比较 发 现 网 络 生 成 的 数据 和 PDF 样本 文件 中 受 初 始 样本 和 随机 变异 情况 影响 较 大 ， 变 异 速度 较 快 但 覆盖 量 
的 数据 结构 基本 一 致 ， 能 正确 地 生成 obj 对 象 的 开头 、 结 尾 、 较 低 ， 通 过 率 较 低 ， 模 糊 测 试 发 现 漏洞 的 效率 较 低 。RNNS 数 
常用 关键 字 和 格式 ， 只 是 在 数据 值 上 不 同 ， 通 过 7 万 条 数据 训 。 ” 据 集 的 覆盖 量 最 高 ， 通 过 率 较 NORMAL 数据 集 低 ， 在 通过 率 
练 后 ,实际 实验 中 用 4 个 模型 共 测 试 共生 成 了 20 万 条 数据 检验 。 ”和 和 覆盖 率 比 较 均 衡 ， 由 循环 神经 网 络 产生 的 数据 只 有 少量 因 结 
后 未 发 现 相 同 数据 ， 数 据 长 度 也 和 训练 数据 集 接近 ， 说 明了 网 构 规 约 被 CAJViewer 阅读 器 拒绝 ， 鉴 于 模型 自 带 的 变异 性 和 高 
络 根据 理解 产生 了 相似 的 新 数据 ， 从 触发 异常 概率 角度 来 讲 要 ”覆盖 量 ， 因 此 具备 触发 程序 异常 的 机 会 更 多 。NORMAL 数据 
优 于 随机 变异 的 数据 。 性 能 情况 ， 使 用 常规 双核 26xx 系 CPU、  ” 集 的 通过 率 较 高 ， 履 盖 量 属 中 等 但 缺少 数据 变异 ， 产 生 异 常 的 
2 GB 内 存 Linux 服务 器 ， 训 练 100 次 epoch 为 例 大 约 用 时 30 ”可 能 性 较 低 , 相 较 于 RNNS 数据 集 存在 覆盖 量 和 变异 度 的 较 低 。 
个 小 时 。 可 以 从 表 1 和 图 8 所 示 验 证 Perplexity (复杂 度 ， 是 用 以 上 分 析 表 明生 成 模型 能 对 字符 文本 型 数据 较为 智能 地 形 
来 评价 一 个 语言 模型 预测 样本 的 标准 ， 复 杂 度 越 低 ， 代 表 模 型 ” 成 用 例 生成 基础 规则 ， 合 理 地 生成 能 兼顾 的 通过 率 和 覆盖 率 的 
的 预测 性 能 越 好 。) 对 比 情况 , LSTM-50 验证 的 Perplexity 最 佳 ， ”测试 用 例 ， 较 适用 于 以 字符 文本 型 为 表示 基础 的 文件 格式 和 通 
GRU-50 训练 速度 最 快 , 不 同 的 batch-size 对 训练 效果 有 和 较 大 影 盲 协议 的 模糊 测试 的 测试 用 例 生成 工作 。 
啊 ， 与 模型 关于 神经 网 络 层 的 论述 一 致 。 以 上 实验 过 程 ， 除 了 验证 了 模型 的 可 行 性 和 优良 效果 ， 也 


1 


通过 以 上 分 析 表 明 ， 除 了 以 上 两 个 模型 仍 有 优化 空间 和 更 通过 实践 过 程 启发 了 对 于 深度 学 习 和 模糊 测试 的 进一步 结合 下 
多 模型 选择 可 以 提升 效果 ， 如 注意 力 机 制 的 RNNs 模型 等 ; 该 ” 究 的 方向 ， 一 是 要 扩大 模型 应 用 范围 ， 需 降低 向 量化 的 难度 ， 
方法 依赖 于 样本 数据 和 向 量化 处 理 ， 综 合 实现 代价 和 资源 性 能 可 以 考虑 用 卷 积 神经 网 络 或 有 效 的 提取 特征 方法 降 维 提高 向 量 
需求 等 问题 ， 较 适用 于 规约 较为 复杂 的 字符 文本 型 数据 ， 局限 化 能 力 ;， 二 是 提升 模型 生成 效果 ， 可 以 借鉴 AFL 和 VUzzer 等 
性 学 习 训练 效果 依赖 于 数据 样本 ， 对 于 规约 简单 和 缺乏 可 学 习 ”有 反馈 能 力 指导 等 先进 模糊 测试 思想 , 用 神经 网 络 对 trace 信息 
数据 就 不 具 太 好 优势 和 价值 。 的 学 习 和 预测 ， 由 路 径 主导 测试 用 例 生成 形成 反馈 闭环 ， 提 升 

2) 对 比 评估 分 析 测 试用 例 效果 路 径 探 索 深 度 和 效率 ; 三 是 研究 合适 的 深度 学 习 网 络 学 习 脆弱 

为 评估 本 实验 中 模型 的 效果 ， 选 取 在 模糊 测试 中 最 具 代 表 ”点 特征 和 异常 的 导向 分 布 等 辅助 权重 知识 ， 让 测试 用 例 生成 更 
性 的 代码 覆盖 率 和 通过 率 这 两 项 指标 来 对 比分 析 。 有 针对 性 ， 更 易 触发 异常 。 


覆盖 率 方面 ， 本 文采 用 和 和 覆盖 率 相同 效果 的 动态 链接 库 地 
址 覆盖 量 来 对 比 评估 。 由 测试 执行 过 程 中 peachminset 执行 
CAJViewer 生成 的 trace 文件 , 编写 统计 程序 , 统计 履 盖 的 动态 本 文 简 述 了 基于 循环 神经 网 络 构造 测试 用 例 生成 模型 的 基 
链接 库 和 地 址 情况 。 本 文 以 统计 trace 文件 的 地 址 覆盖 量 为 参 本 原理 和 构架 ,以 CAJViewer 阅读 器 解析 PDF 文件 为 实验 对 象 
照 。 履 盖 量 越 多 ， 表 明 程 序 履 盖 的 路 径 和 代码 块 越 多 ， 则 测试 。” 进行 了 训练 数据 采集 、 数 据 处 理 、 网 络 训练 、 数 据 生成 组 装 和 
用 例 的 效果 就 越 好 。 评估 流程 ， 结 果 分 析 验 证 了 模型 的 可 行 性 和 实用 性 。 经 过 由 模 
通过 率 方面 ,分 析 了 CAJViewer 阅读 器 对 文件 的 处 理 过 程 ， 糊 测试 、 深 度 学 习 理论 到 模型 设计 和 实践 的 过 程 ， 更 能 深刻 体 
编写 通过 率 验证 程序 ， 执 行 CAJViewer 加 载 测试 用 例 ， 监 控 执 。” ”会 深度 学 习 网 络 解 决 复杂 问题 的 优势 ， 理 解 了 依靠 数据 和 网 络 
行 过 程 中 是 否 报错 和 弹出 异常 对 话 框 ， 无 任何 异常 为 通过 ， 反 模型 为 基础 的 特征 提取 分 析 处 理 方法 ， 本 质 上 是 尽 可 能 地 代替 
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工 完成 繁琐 工作 提升 效率 。 同 时 ， 模 糊 测试 技术 中 对 特征 的 
发 掘 和 应 用 需求 很 多 ， 深 度 学 习 与 模糊 测试 之 间 存 在 较 多 的 契 
合 点 ， A 随 着 人 工 智能 技术 的 发 展 和 神经 
网 络 模型 的 层出不穷 ， 可 以 预期 必 将 会 出 现 更 多 更 优 更 好 的 算 
法 和 模型 来 提升 模糊 测试 水 平 。 
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